草庐IT

R textConnection速度慢

全部标签

performance - Tableau 受限 Data Extract 连接速度慢

我在Tableau中设计可视化,我的数据在Hive/hadoop中,数据量很大,当我尝试设计可视化时,查询运行非常非常慢,因为每次它尝试从hadoop中提取数据。所以对于任何可视化,简单的拖放通常需要4分钟,而可视化可能需要10秒的拖放,所以我最终要花很多时间等待。我尝试使用数据提取选项,但是它永远需要数据提取(38分钟并且仍在继续)问题:有没有办法我只能提取1000条记录,这样我就可以处理这1000条记录来创建可视化,然后在设计完成后切换到实时连接。我试图查看画面社区的帮助,但到目前为止没有运气 最佳答案 复制XL中的所有数据并将

hadoop - Apache Hadoop HDFS 能否帮助加快大型文件上传(通过网络浏览器)到服务器的速度?

据我所知,HadoopHDFS不能提高网络速度,但我在与一些人讨论时试图集思广益,讨论如何显着加快上传速度,有人说他们能够显着提高使用HDFS的上传速度。如果用户在LAN(100MBPS)上,当用户使用浏览器上传大于100GB的大文件时,HadoopHDFS是否可以通过某种方式帮助提高上传速度? 最佳答案 网络浏览器和网络服务器本身将成为瓶颈。与hadoopfs-copyFromLocal的直接数据节点编写器相比,他们必须在那个服务器上缓冲文件,然后上传到HDFSHUE(使用WebHDFS)以这种方式运行,我认为没有一种简单的方法可

hadoop - 是否建议启动ambari中的所有服务以加快通信速度?

是否建议启动“Ambari”中的所有服务,在为了加快沟通速度。 最佳答案 不,您不需要启动所有服务来加速通信。因为您在设置初始集群或添加节点时已经与ambari建立了通信。现在,当您开始使用ambariweb控制台时,ambari会自动在组件和服务之间建立通信。 关于hadoop-是否建议启动ambari中的所有服务以加快通信速度?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/

database - HDFS 中存储了什么以及为什么 Titan 执行查询时 map-reduce 计算速度如此之快?

我现在正在学习Titan。我在远程模式下将Titan与HBase结合使用。现在有三个问题让我很困惑。我在下面描述了它们:在TinkerPop3文档中,它说“任何OLAP操作的结果都存储在可通过hdfs访问的HDFS中。”但是现在我用Titan做OLTP,这种情况下HDFS里面存的是什么?当我们使用Titan连接HBase成功时(通过JavaIDE),我们可以看到在HBaseshell中创建的表并扫描内容。table中的content'column'是什么意思?它们代表图中的顶点id吗?当我测试Titan的性能时,我观察到查询速度比普通的map-reduce作业快。为什么泰坦能做到呢?在

hadoop:当文件小于64M时,增加节点数对处理速度有影响吗?

我知道默认的blocksize是64M,split是64M,那么对于小于64M的文件,当节点数从1增加到6时,只有一个节点做split,速度不会提升?那正确吗?如果是128M的文件,2个节点做2个split,速度比1个节点快,如果超过3个节点,速度上不去,是这样吗?不知道我的理解对不对,谢谢大家的意见! 最佳答案 这里是你的问题的答案Iknowthedefaultblocksizeis64M,在hadoop1.0版中,默认大小为64MB,而在2.0版中,默认大小为128MB。可以通过在配置文件hdfs-site.xml中为参数dfs

hadoop - RAMdisk 中的 HBase 速度较慢

我有一个关于将ApacheHBase与RAMdisk一起使用的一般性问题。单个表中有大量数据集合,总共约25GB。有了这些数据,我正在使用Java程序进行一些基本的聚合。因为我有足够的RAM,我尝试使用tmpfs将这个数据集放入RAMdisk:mount-ttmpfs-osize=40Gnone/home/user/ramdisk然后我停止了HBase,将data文件夹的内容复制到RAMdisk中。最后我创建了一个符号链接(symboliclink),将旧数据目录链接到新数据目录并再次启动HBase。它有效,但是当我现在处理聚合时,它变得比以前稍微慢。如果HBase压缩数据(激活Sna

hadoop - SQOOP 从 RDBMS 转移到 Hadoop 的速度有多快?

谁能告诉我,SQOOP一次传输20亿条记录的速度有多快。而且我知道它一定很快,因为sqoop并行运行,其中一些输入将在Hadoop上产生一些文件输出。但我想知道MapReduce一次传输20亿条记录的速度详情。 最佳答案 您需要了解负责将数据从RDBMS更快地传输到Hadoop的要点。映射器数量:增加映射器的数量会提高您的速度,因为它将任务分成几部分并并行执行导入。映射器上的平衡负载:您需要在统一的列上拆分(最好是整数)。它将为所有映射器提供均衡负载,并且传输速度更快。来自RDBMS的连接数:您不能只是盲目地增加映射器的数量(例如1

hadoop - 是否值得购买 Mahout in Action 以跟上 Mahout 的速度,或者是否有其他更好的来源?

我目前是ApacheMahout的一个非常随意的用户,我正在考虑购买这本书MahoutinAction.不幸的是,我真的很难了解这本书的值(value)——并且看到它是ManningEarlyAccessProgram书(因此目前仅作为测试版电子书提供),我无法亲自去书店看书。任何人都可以推荐这个作为快速了解Mahout和/或可以补充Mahout网站的其他来源的好(或不太好)指南吗? 最佳答案 作为Mahout的提交者和本书的合著者,我认为这是值得的。;-)但是说真的,你在做什么?也许我们可以为您指出一些资源。Mahout的某些方面

GitHub 又一可视化低代码神器,诞生了!速度!手慢无!

在此之前,我曾多次与您交谈,在现阶段互联网业务疯狂增长的推动下,低代码编程被赋予了新的使命和义务,即帮助开发人员快速构建一个可以在早期以较低成本投入市场的应用程序。那么,有没有一个成熟的低代码工具是开源的、易于使用的、对中国用户友好的?答案自然就在那里。最近,我在GitHubTrending:ILLA中遇到了一个开源的低代码开发平台,它可以用来快速构建内部工具。在企业发展过程中,会有大量的定制开发问题,无法通过购买标准化的SAAS来解决。为了解决这些问题,经常需要许多重复的、工作量大的后台系统。对于前端人力不足的团队或公司来说,这些问题尤其令人痛苦。通过ILLA,企业可以用很少的工程师解决各种

java - 与 Resin Professional 相比,Quercus PHP 在 Resin Open Source 上的速度有多快(慢)?

Caucho的聪明人很快指出Quercus比直接mod_php(没有APC)快3-5倍。但是深入研究文档,您会发现PHP到字节码的编译仅在ResinPro(699美元)中可用。我想知道的是,ResinOpenSource执行PHP代码的速度有多快(即多慢)?是的,我知道我可以测试它,这取决于应用程序,它取决于环境,等等等等。但我只需要以前做过的任何人的一个轶事数据点,无论它是否具有统计显着性......都没关系! 最佳答案 Quercus独立于Resin(开源或商业),并且它本身是开源的。我们在Jetty和Tomcat上运行Quer